AI资讯新闻榜单内容搜索-DeepSeek

刚刚，DeepSeek V4基准测试泄露！疑似明天发布，全场惊呼新王归来

DeepSeek V4，据说明天就要上线了？这是首个匹敌顶尖闭源模型的开源模型，被网友评为「一鲸落万物生」。泄露的基准测试显示，它在SWE-bench Verified上取得了83.7%，已经超越Opus 4.5和GPT-5.2！

来自主题: AI资讯

10420 点击 2026-02-16 20:04

刚刚，DeepSeek官宣更新了！突然「变冷」冲爆热搜

确认了！DeepSeek昨晚官宣网页版、APP更新，支持100k token上下文。如今，全网都在蹲DeepSeek V4了。

来自主题: AI资讯

8531 点击 2026-02-14 18:23

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

11248 点击 2026-02-12 18:07

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

6809 点击 2026-02-12 15:32

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

8298 点击 2026-02-12 14:56

刚刚，DeepSeek悄悄测试新模型：百万token上下文、知识库更新，V4要来了？

春节假期还没到，DeepSeek 就先把礼物拆了一半。

来自主题: AI资讯

10544 点击 2026-02-12 11:29

训练加速1.8倍，推理开销降78%！精准筛选题目高效加速RL训练丨清华KDD

以DeepSeek R1为代表的一系列基于强化学习（RLVR）微调的工作，显著提升了大语言模型的推理能力。但在这股浪潮背后，强化微调的代价却高得惊人。

来自主题: AI技术研报

10091 点击 2026-02-10 14:19

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

2025 年 1 月 20 日，DeepSeek 发布了推理大模型 DeepSeek-R1，在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。研究者发现，在数学推理等具有明确答案的任务

来自主题: AI技术研报

7319 点击 2026-02-08 11:52

字节阿里DeepSeek决战春节：一场关乎14亿人的重磅AI大战

这个春节，中国 AI 迎来「决战时刻」。据《The Information》援引内部消息人士透露：字节或将祭出全模态三件套；阿里除了或将发布强大的全新旗舰模型 Qwen 3.5 外，也会让千问打通支付与电商，挑战豆包；DeepSeek V4 或将携最强代码能力突袭。这不仅是技术竞赛，更是对 14 亿用户生活入口与未来互联网秩序的终极争夺。

来自主题: AI资讯

9239 点击 2026-01-30 19:21

刚刚，DeepSeek又探索新架构了，开源OCR 2

嘿！刚刚，DeepSeek 又更新了！这次是更新了十月份推出的 DeepSeek-OCR 模型。刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构，实现了视觉编码从「固定扫描」向「语义推理」的范式转变！

来自主题: AI资讯

9991 点击 2026-01-27 17:15